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60 

CTCTAGACCA fCTACTATCC GGTTGTTGAC CCTTAAAGCT TTTGAAGACT ACTAGAATAA 

120 

TGCAAATACC ATA'XGTCCAT ATCCATCCTT TTCTTTTGTT TGAACTGAAC ATTCTAATTT 

180 

TGTAAAAGAA aaaacOhttat GTTAATATCA CCGTAGGCAA AAAAAATATC tcatcatatt 

240 

AAATTTTTAT TATAAGAfTA TACATTCTCT CGTTGTAAGA GTTACTCCAA TTGCAAGTGT 

300 

TGTATTAACT AATAAAAAdp ACGAAAGTAG GAAGCTTATA ATTAATTGAT GTTGCATAGT 

360 

ACTGGTATAT TGTTGATGAA\TATAACAAGT ATGAACATTA ATGCATGAAA CGGGGTATTT 

420 

TGTCTTGAAC TCATTAAAGG (^AATGTGAAA AGAAGATGTG AGGTCTCATT TTGAAAATTT 

480 

ATCTTCTAGC TTTGTCGATT TT^^AATCTAT GAAATGAACG CAACATATAG AAATTTCATG 

540 

TGGACAACGA CATTTAGACG GTAtCTTAAT TAGACCGATT AATTAGTAAT ATACTTATAT 



ATATAATTAG TGGTGATTAT 



ACCTTAATGT CGAAAGAAGC 




600 

ACTT ATCCACTTGA GAATTTAAAC AATGGGCAAT 

660 

lAOff TCGTGTAATG AGTTATGGGG GAGAGATCCT 



720 

GTTAAATCGT CAAATAAAAC fiACTTAAbAA tTAGAAATTG ACACCAAAAA TCATAAAGAG 



AACGTTGAAG AAGTCATTTA 



GCCGTTGAAA GGGCTTGTAA G. 



GAAATAGAAG AACAATGATG TT. 



GAGAGAGAGA AGAAAATTAG GTC. 



780 

CATATTTC CTAGCTAAGA TCAAATCAAG 

840 

CCGT GGGGTTTAGA AGAAAGACAA 



900 

TATTTTGGTG TATAGGAGTT GTCAAAAGAG 



960 

lAGCACTAA AAATGGAGAC ATGTGTTGAG 



1020 

TAACTATTAC AAGAGCGACT TATGCTTCCT TA^TGGCAATG ATATCCAAAC CAAAGTGCAA 

1080 

CGCTCCTTTT TTGCCCTAAT TTCGTAAAGT CTCtCTCCTT CTTCGTCCTT AGGAAAAACC 

1140 

CTAGAAATTT AATCCCTTGT TCTTGATCTT GCTTtTTGAG TAACCATGAT TTTGACCACA 

1200 

CACTATTTCT TCTATCTTTT GTGGTCTATA GGATTtTGCT TTATATGTGT TTCTTGTATT 

1260 

GCTCCGTACG TACGTATACG AATTTAAATG GTTATAACAA GGTTTATATA AACTAGCACA 



43 



10 



25 



40 



55 



1320 

AATGAGTCCA TGAAATTTGT TAGCGAAAAA GGTAGAAATA TATTGAGTCT TTAAACGGCA 

1380 

ATATATATAA TTTTGCTGCA AAACTTAGCT TTAATCATGA TCTAATGATA TTTTCTTTAA 

1440 

TTTCCTTTGC CAAATTAATC ACATGCACGG ATTTTTGGCA AGTTATGTGT CGAATTCTTC 

1500 

CATTCACACA ACACTAAACT TAATTAGAAC TCTAGGAAAT ATTTTAAAAT GACAACTTTA 



1560 

15 TCGAAAAAAA TTTAGTTATG AAAACAATTC CAGAATTAAA CATGAGCTAT ATAATTTAAG 

1620 

ATAAAATGAA GTAATATTGA TATGTATGTA ATAACATATC TGATTGCGGT AAAAAAAAAC 

20 1680 
ATATCTGATT AAATTGTTCA TGCAGGCCCA TGTCACTATG ATGTCATCAC GTTTTTATTT 



1740 

TCACAATAAC TAATATATAT TCAAAAAAAT AGTTTTGTCA GATTAAATTT TTTTTGGTGG 

1800 

TCAGCTTTCT CCAACCTACT AAACTAGTTT GGAATGTTCT CTTCTTTATT TTTCTTTTTC 



1860 

30 TTGATTTCTT ATGTTTTTTA TTTATGGAAT TTTAAGACGG ATTGTTTAGG TCGTTTCTCT 

1920 

CTTTTCTTGT TTTCTAAAGT TACTTTTGTA AACTCATCTC CTCCCAATTA GACAGTCAAT 

35 1980 
CATATAGTTA TCTTTTAATA TATGTCTAGT TGATAAAAAA AATGAAAAAA TACTGGTGGT 



2040 

AGTTCTACTA ATGTTTGTGT AAAAAATCTG ATATTATGAA TCTAATCAAT TTCTTTGATC 

2100 

GTATAATGTG GGTTAAATTT AGTAATTTTT TACATAAATA AGAACTGTAA TGTTGATGTA 



2160 

45 TATTGGGGAA TCAGTATATT AGCTTGGGTA ACTATACTTC TGGAAATACT TGAAGATTTA 

2220 

ACTATTTGCA AAATTATAAT TTAGTCCCGA AAAATACAGA CGACGGGACA CGACAACATA 

50 2280 
TAAGCAGGTT TGAATCTTGG AAAATTTTGT ATACATAACC TATATAAATA CTAATGTTCT 



2340 

GGTTGGGTTC AAAAGCCTTT TCAAAAGTTC CATTTTTTAA ATTCAAGGAC ATTTTACATA 

2400 

GGAAATAAGT TGAGTCATAA AAAATAATGG TTATTTTGTA AGGTTTTTTT TTTGATTAAA 



2460 

60 ACGCACATAT TAAGAAGTTA GTTTTTTTTC ACTACCAAAT ATCAATTAAT TTAAAACCAT 

2520 

GCAACCATTC ATAAAACAAT ACTATTAAAG AATATAAATA ATCACAAAAT ATTAAATACA 

65 2580 
CTTAAAATTT ACATATAAAT TTACAAAACA TCTAATTAAT TGAAACAGAA AGGAAAAGGT 

2640 



44 



• 



AAAATATATC ATAAAATGAG ACATATATCC TATAAAAAAA AAATGAGGCA TATGAAGTAA 

2700 

ATAATAAGAG ACATGCATGT AAGCATTCGG TTAATTAATC GAGTCAAAGA TATATATCAG 

5 

2760 

TAAATACATA TGTGTATATT TCTGGAAAAA GAATATATAT ATTGAGAAAT AAGAAAAGAT 

2820 

10 GAAAATGGAA AATGGTATGT ATAAAAAGAA AGGAGTGTGC GACTCTTGTG TCTCGTCCAA 

ME NGM YKKK GVC DSC VSSK> 

2880 

AAGCAGATCC AACCACAGCC CCAAAAGAAG CATGATGGAG CCTCAGCCTC ACCATCTCCT 
15 SRSNHSPKRSMMEPQPHHLL> 

2940 

CATGGATTGG AACAAAGCTA ATGATCTTCT CACACAAGAA CACGCAGCTT TTCTCAATGA 
MDW NKA NDLL TQE HAA FLND> 

20 

3000 

TCCTCACCAT CTCATGTTAG ATCCACCTCC CGAAACCCTA ATTCACTTGG ACGAAGACGA 
PHH LML DPPP ETL IHL DEDE> 

25 3060 
AGAGTACGAT GAAGACATGG ATGCGATGAA GGAGATGCAG TACATGATCG CCGTCATGCA 
EYD EDM DAMK EMQ YMI AVMQ> 

3120 

30 GCCCGTAGAC ATCGACCCTG CCACGGTCCC TAAGCCGAAC CGCCGTAACG TAAGGATAAG 

PVD IDP ATVP KPN RRN VRIS> 

3180 

CGACGATCCT CAGACGGTGG TTGCTCGTCG GCGTCGGGAA AGGATCAGCG AGAAGATCCG 
35 DDPQTVVARRRRERISEKIR> 

3240 

AATTCTCAAG AGGATCGTGC CTGGTGGTGC GAAGATGGAC ACAGCTTCCA TGCTCGACGA 
ILK RIV PGGA KMD TAS MLDE> 

40 

3300 

AGCCATACGT TACACCAAGT TCTTGAAACG GCAGGTGAGG ATTCTTCAGC CTCACTCTCA 
AIR YTK FliKR QVR ILQ PHSQ> 

45 3360 
GATTGGAGCT CCTATGGCTA ACCCCTCTTA CCTTTGTTAT TACCACAACT CCCAACCCTG 
IGA PMA NPSY LCY YHN SQP*> 

3420 

50 ATGAACTACA CAGAAGCTCG CTAGCTAGAC ATTTGGTGTC ATCCTCTCAA CCTTTTTCAT 

3480 

GTTGATATAT TATATATAGA TGCATAAAGA TTCGATCCAA GATTGTATGG GTGTTTTAAT 

55 3540 
ATTATTATTC TAAGATATAT GATGTACAAT TGTGTACCAA GTTTCTTTAT CTTGATATCA 

3600 

TATGCATAAA TAATTGGTGA ATAAAAAGAA GATATTGATT GTAAACAAAA AAAAGAAGAT 

3560 

ATTGATTGTT AATTAGGGTT TGATCATTCT GTATGAAAGC TTTGGCCTGC AAATTAATTT 



60 



3720 

65 TCGATATATA TATATATATA TGGAGAATAT ATATCAAATA CTTTTTTAAT TTGACTATAA 

3780 

TTTGTATCAA TTATCTGAAT CTGATGAGTG TAGGTTATAT ATGGATTAGC AAAAAAGAAA 



45 



% 



3840 

ACAACCATTA TTACGCACCT ACATTAAAAA TCATCCACCA AAGAAGAAAC CATCCTCAAG 
AGGGTTCCCT CTAGAG 



SEQ ID N0:2 INDl protein 

ME NGM YKKK GVC DSC VSSK 
SRS NHS PKRS MME PQP HHLL 
MDW NKA NDLL TQE HAA FLND 
15 PHH LML DPPP ETL IHL DEDE 
EYD EDM DAMK EMQ YMI AVMQ 



10 



20 



35 



50 



PVD IDP ATVP KPN RRN VRIS 
DDP QTV VARR RRE RIS EKIR 



ILK RIV PGGA KMD TAS MLDE 
25 AIR YTK FLKR QVR ILQ PHSQ 
IGA PMA NPSY LCY YHN SQP* 

SEQ ID NO:3 INDl 5' promoter 
30 60 

CTCTAGACCA TCTACTATCC GGTTGTTGAC CCTTAAAGCT TTTGAAGACT ACTAGAATAA 

120 

TGCAAATACC ATATGTCCAT ATCCATCCTT TTCTTTTGTT TGAACTGAAC ATTCTAATTT 

180 

TGTAAAAGAA AAAACCTTAT GTTAATATCA CCGTAGGCAA AAAAAATATC TCATCATATT 



240 

40 AAATTTTTAT TATAAGATTA TACATTCTCT CGTTGTAAGA GTTACTCCAA TTGCAAGTGT 

300 

TGTATTAACT AATAAAAAGG ACGAAAGTAG GAAGCTTATA ATTAATTGAT GTTGCATAGT 

45 360 
ACTGGTATAT TGTTGATGAA TATAACAAGT ATGAACATTA ATGCATGAAA CGGGGTATTT 



420 

TGTCTTGAAC TCATTAAAGG CAATGTGAAA AGAAGATGTG AGGTCTCATT TTGAAAATTT 

480 

ATCTTCTAGC TTTGTCGATT TTAAATCTAT GAAATGAACG CAACATATAG AAATTTCATG 



540 

55 TGGACAACGA CATTTAGACG GTATCTTAAT TAGACCGATT AATTAGTAAT ATACTTATAT 

600 

ATATAATTAG TGGTGATTAT AAGTTTACTT ATCCACTTGA GAATTTAAAC AATGGGCAAT 

60 660 
ACCTTAATGT CGAAAGAAGC CGTCCCCACT TCGTGTAATG AGTTATGGGG GAGAGATCCT 

720 

GTTAAATCGT CAAATAAAAC AACTTAAGAA CTAGAAATTG ACACCAAAAA TCATAAAGAG 



46 



9 



10 



25 



40 



55 



780 

AACGTTGAAG AAGTCATTTA TCGTATCCAG CTCATATTTC CTAGCTAAGA TCAAATCAAG 

840 

GCCGTTGAAA GGGCTTGTAA GAAAATGTCG AAGAAACCGT GGGGTTTAGA AGAAAGACAA 

900 

GAAATAGAAG AACAATGATG TTAAATTGCC TATTTTGGTG TATAGGAGTT GTCAAAAGAG 

960 

GAGAGAGAGA AGAAAATTAG GTCAAAATAA TGAGCACTAA AAATGGAGAC ATGTGTTGAG 



1020 

15 TAACTATTAC AAGAGCGACT TATGCTTCCT TATGGCAATG ATATCCAAAC CAAAGTGCAA 

1080 

CGCTCCTTTT TTGCCCTAAT TTCGTAAAGT CTCTCTCCTT CTTCGTCCTT AGGAAAAACC 

20 1140 
CTAGAAATTT AATCCCTTGT TCTTGATCTT GCTTTTTGAG TAACCATGAT TTTGACCACA 

1200 

CACTATTTCT TCTATCTTTT GTGGTCTATA GGATTTTGCT TTATATGTGT TTCTTGTATT 



1260 

GCTCCGTACG TACGTATACG AATTTAAATG GTTATAACAA GGTTTATATA AACTAGCACA 



1320 

30 AATGAGTCCA TGAAATTTGT TAGCGAAAAA GGTAGAAATA TATTGAGTCT TTAAACGGCA 

1380 

ATATATATAA TTTTGCTGCA AAACTTAGCT TTAATCATGA TCTAATGATA TTTTCTTTAA 

35 1440 
TTTCCTTTGC CAAATTAATC ACATGCACGG ATTTTTGGCA AGTTATGTGT CGAATTCTTC 



1500 

CATTCACACA ACACTAAACT TAATTAGAAC TCTAGGAAAT ATTTTAAAAT GACAACTTTA 

1560 

TCGAAAAAAA TTTAGTTATG AAAACAATTC CAGAATTAAA CATGAGCTAT ATAATTTAAG 



1620 

45 ATAAAATGAA GTAATATTGA TATGTATGTA ATAACATATC TGATTGCGGT AAAAAAAAAC 

1680 

ATATCTGATT AAATTGTTCA TGCAGGCCCA TGTCACTATG ATGTCATCAC GTTTTTATTT 

50 1740 
TCACAATAAC TAATATATAT TCAAAAAAAT AGTTTTGTCA GATTAAATTT TTTTTGGTGG 

1800 

TCAGCTTTCT CCAACCTACT AAACTAGTTT GGAATGTTCT CTTCTTTATT TTTCTTTTTC 



1860 

TTGATTTCTT ATGTTTTTTA TTTATGGAAT TTTAAGACGG ATTGTTTAGG TCGTTTCTCT 



1920 

60 CTTTTCTTGT TTTCTAAAGT TACTTTTGTA AACTCATCTC CTCCCAATTA GACAGTCAAT 

1980 

CATATAGTTA TCTTTTAATA TATGTCTAGT TGATAAAAAA AATGAAAAAA TACTGGTGGT 

65 2040 
AGTTCTACTA ATGTTTGTGT AAAAAATCTG ATATTATGAA TCTAATCAAT TTCTTTGATC 

2100 



47 




GTATAATGTG GGTTAAATTT AGTAATTTTT TACATAAATA AGAACTGTAA TGTTGATGTA 

2160 

TATTGGGGAA TCAGTATATT AGCTTGGGTA ACTATACTTC TGGAAATACT TGAAGATTTA 

5 

2220 

ACTATTTGCA AAATTATAAT TTAGTCCCGA AAAATACAGA CGACGGGACA CGACAACATA 

2280 

10 TAAGCAGGTT TGAATCTTGG AAAATTTTGT ATACATAACC TATATAAATA CTAATGTTCT 

2340 

GGTTGGGTTC AAAAGCCTTT TCAAAAGTTC CATTTTTTAA ATTCAAGGAC ATTTTACATA 

15 2400 
GGAAATAAGT TGAGTCATAA AAAATAATGG TTATTTTGTA AGGTTTTTTT TTTGATTAAA 



20 



35 



50 



2460 

ACGCACATAT TAAGAAGTTA GTTTTTTTTC ACTACCAAAT ATCAATTAAT TTAAAACCAT 

2520 

GCAACCATTC ATAAAACAAT ACTATTAAAG AATATAAATA ATCACAAAAT ATTAAATACA 



2580 

25 CTTAAAATTT ACATATAAAT TTACAAAACA TCTAATTAAT TGAAACAGAA AGGAAAAGGT 

2640 

AAAATATATC ATAAAATGAG ACATATATCC TATAAAAAAA AAATGAGGCA TATGAAGTAA 

30 2700 
ATAATAAGAG ACATGCATGT AAGCATTCGG TTAATTAATC GAGTCAAAGA TATATATCAG 

2760 

TAAATACATA TGTGTATATT TCTGGAAAAA GAATATATAT ATTGAGAAAT AAGAAAAGAT 



GAAAA 



SEQ ID NO:4 INDl 3' promoter 



3420 

40 ATGAACTACA CAGAAGCTCG CTAGCTAGAC ATTTGGTGTC ATCCTCTCAA CCTTTTTCAT 

3480 

GTTGATATAT TATATATAGA TGCATAAAGA TTCGATCCAA GATTGTATGG GTGTTTTAAT 

45 3540 
ATTATTATTC TAAGATATAT GATGTACAAT TGTGTACCAA GTTTCTTTAT CTTGATATCA 



3600 

TATGCATAAA TAATTGGTGA ATAAAAAGAA GATATTGATT GTAAACAAAA AAAAGAAGAT 

3660 

ATTGATTGTT AATTAGGGTT TGATCATTCT GTATGAAAGC TTTGGCCTGC AAATTAATTT 



3720 

55 TCGATATATA TATATATATA TGGAGAATAT ATATCAAATA CTTTTTTAAT TTGACTATAA 

3780 

TTTGTATCAA TTATCTGAAT CTGATGAGTG TAGGTTATAT ATGGATTAGC AAAAAAGAAA 

60 3840 
ACAACCATTA TTACGCACCT ACATTAAAAA TCATCCACCA AAGAAGAAAC CATCCTCAAG 

AGGGTTCCCT CTAGAG 



48 



% 



10 



25 



40 



55 



SEQ ID NO: 5 SHPl genomic 



60 

AGATCTGCAA CAGTGAAAAG AGAAAACAAA ATGGACTTGA AGAGGTTTTG ACAATGCCAG 

120 

AGATAATGCT TATTCCCTAA TATGTTGCCA GCCAAGTGTC AAATTGGCTT TTTAAATATG 

160 

GATTTCTGTA TCAGTGGTCA TATTTGTGGA TCCAACGTAT TCATCATCAA GTTCTCAAGT 

240 

TTGCTTTCAG TGCAATTCTA ATTCACACGT TTAACTTTAA CATGCATGTC ATTATAATTA 



300 

15 CTTCTTCACT AAGACACAAT ACGGCAAACC TTTCAGATTA TATTAATCTC CATAAATGAA 

360 

ATAATTAACC TCATAATCAA GATTCAATGT TTCTAAATAT ATATGGACAA AATTTACACG 

20 420 
GAAGATTAGA TACGTATATT AGTAGATTTA GTCTTTCGTT TGTGCGATAA GATTAACCAC 



480 

CTCATAGATA GTAATATCAT TGTCAAATTC CTCTCGGTTT AGTCGCTAAA TTGTATCTTT 

540 

TTTAAGCCTA AAAGTAGTGT ATTCGCATAT GACTTATCGT CCTAACTTTT TTTTTAATTA 



600 

30 ACAAAAAAAT CGAAAAGAAA ATAATCTGTT AAATATTTTT TAAGTACTCC ATTAAGTTTA 

660 

GTTTCTATTT AAAAAATGCT TGAAATTTGA CAGTTATGTT CAACAATTTT GAATCATGAG 

35 720 
CGATGTCTAG ATACTCAGAA TTTAATCAAG ATGTCTTATC AAATTTGTTG TCACTCGAGG 

780 

ACCCACGCAA AAGAAAAGAC TAATATGATT TTTATTTGGT CTGGATATTT TTGTAGAGGA 



840 

TGAAACTAAG AGAGTGAAAG ATTCGAAATC CACAATGTTC AAGAGAGCTC AAAGCAAAAA 



900 

45 GAAAAATGAA GATGAAGGAC TAAAGAACAA TAAGCAACTA CTTATACCCT ATTTCCATAA 

960 

AGGATTCAGG TACTAGGAGA AGTTGAGGCA AGTTNNNNNN NATTGATTCA AATTTTCATT 

50 1020 

TATTTTTACA ATTTAATTCA CCTAAGTTAT TATGCATTTC TCATCATTGG TACATTTTCT 

1080 

GTATAGCGTA TTTACATATA TGAAATAAAT TAAATATGTC CTCACGTTGC AAGTAGTTAA 



1140 

TGAATGTCCC CACGCAAAAA AAAATCCCTC CAAATATGTC CACCTTTTCT TTTCTTTTTA 



1200 

60 ATTCCAAAAT TACCATAAAC TTTTGGTTTA CAAAAGATTT CTAGAAATTG AGGAAGATAT 

1260 

CCTAAATGAT TCATGAATCC TTCAATAATC TGAAGTTTGC GATATTTTCG ATTTTCTTCA 

65 1320 
AGAGTTGCGA TATTTGTAAT TTGGTGACCT TAAACTTTTT TTGATAAAGA GTAAACGTTT 



49 



1380 

TTTCTTAAAA GTAAAACTTG ATTTTATGTT TTAGGGTTCT AGCTCAACTT TGTATTATAT 

1440 

5 TTCTTGCAAA AAGAGTTCGT TAACTGCATT CTTCAACACT ATAAAGTGAT TATCAAAAAC 

1500 

ATCTTCATGA ACATTAAGAA AAACAATATT TGGTTTCGGT TAGAGCTTGG TTTTGCTTGG 

10 1560 
CTTGATTCAC ATACCCATTC TAGACTTTGG CATAAATTTG ATACGATAGA GAGTATCTAA 

1620 

TGGTAATGCA GAAGGGTAAA AAAAGGAAGA GAGAAAAGGT GAGAAAGATT ACCAAAAATA 



15 



30 



45 



60 



1680 

AGGAGTTTCA AAAGATGGTT CTGATGAGAA ACAGAGCCCA TCCCTCTCCT TTTCCCCTTC 



1740 

20 CCATGAAAGA AATCGGATGG TCCTCCTTCA ATGTCCTCCA CCTACTCTTC TCTTCTTTCT 

1800 

TTTTTTCTTT CTTATTATTA ACCATTTAAT TAATTTCCCC TTCAATTTCA GTTTCTAGTT 

25 1860 
CTGTAAAAAG AAAATACACA TCTCACTTAT AGATATCCAT ATCTATTTAT ATGCATGTAT 

1920 

AGAGAATAAA AAAGTGTGAG TTTCTAGGTA TGTTGAGTAT GTGCTGTTTG GACAATTGTT 



1980 

AGATGATCTG TCCATTTTTT TCTTTTTTCT TCTGTGTATA AATATATTTG AGCACAAAGA 



2040 

35 AAAACTAATA ACCTTCTGTT TTCAGCAACT AGGGTCTTAT AACCTTCAAA GAAATATTCC 

2100 

TTCAATTGAA AACCCATAAA CCAAAATAGA TATTACAAAA GGAAAGAGAG ATATTTTCAA 

40 2160 
GAACAACATA ATTAGAAAAG CAGAAGCAGC AGTTAAGTGG TACTGAGATA AATGATATAG 

2220 

TTTCTCTTCA AGAACAGTTT CTCATTACCC ACCTTCTCCT TTTTGCTGAT CTATCGTAAT 



2280 

CTTGAGAACT CAGGTAAGGT TGTGAATATT ATGCACCATT CATTAACCCT AAAAATAAGA 



2340 

50 GATTTAAAAT AAATGTTTCT TCTTTCTCTG ATTCTTGTGT AACCAATTCA TGGGTTTGAT 

2400 

ATGTTTCTTG GTTATTGCTT ATCAACAAAG AGATTTGATC ATTATAAAGT AGATTAATAA 

55 2460 
CTCTTAAACA CACAAAGTTT CTTTATTTTT TAGTTACATC CCTAATTCTA GACCAGAACA 

2520 

TGGATTTGAT CTATTTCTTG GTTATGTATC TTGATCAGGA AAAGGGATTT GATCATCAAG 



2580 

ATTAGCCTTC TCTCTCTCTC TCTAGATATC TTTCTTGAAT TTAGAAATCT TTATTTAATT 



2640 

65 ATTTGGTGAT GTCATATATG GATCAATGGA GGAAGGTGGG AGTAGTCACG ACGCAGAGAG 

2700 

TAGCAAGAAA CTAGGGAGAG GGAAAATAGA GATAAAGAGG ATAGAGAACA CAACAAATCG 



50 



10 



25 



40 



55 



2760 

TCAAGTTACT TTCTGCAAAC GACGCAATGG TCTTCTCAAG AAAGCTTATG AACTCTCTGT 

2820 

CTTGTGTGAT GCCGAAGTTG CCCTCGTCAT CTTCTCCACT CGTGGCCGTC TCTATGAGTA 

2880 

CGCCAACAAC AGGTACGCTT CTCCTACTCT ATTTCTTGAT CTTGTTTTCT TAATTTTAAC 

2940 

TAAACAAGAT CCTAGTTCAA ATGATAACAA AGTGGGGATT GAGAGCCAAG ATTAGGGTTT 



3000 

15 GGTTAATTTA GAAAACCAGA TTTCACTTGT TGATACATTT AATATCTCTC TAGCTAGATT 

3060 

TAGTACTCTC TCCTCTATAT ATGTGTGGGT GTGTGTGTAA GTGTGTATAT GTATGCAAAT 

20 3120 
GCAAGAAGAA GAAGAAAAAG TTATCTTGTC TTCTCAAATT CTGATCAGCT TTGACCTTAG 

3180 

TTTCACTCTT TTTTCTGCAA ATCATTTGAA CCTGATGCAT GTCAGTTTCT ACAATACACT 



3240 

TTTAATTTTG ACGGCCCATC AAATTTCCTA GGGTTTACTT CAGTGAACAA AATTGGGTTC 



3300 

30 TTGACACGAT TTAGCATGTA TATATAAAAA TAGGGGATGA TCAAGACTTA TGTAACCTCT 

3360 

GTCTGGTGAA ACTAGGGACA AAGTCTACTG ATGAGTTGTC ACTAGGGATC CATTTGATCA 

35 3420 
TTTAATCCCA ACAAAAATGA AACAAAATTT TGAGAATTTA TATGCTGAAG TTTTTCAACC 

3480 

CTCTTTTTTA AATAACTTTA TATTATGTAG ATTTGTATTT AGGGTAATTT GTCCAACTAG 



3540 

AAGTCCTAAA AATCAATAAA CACACGGATG ACTTTGTCTA ACATTGTATC AGTCATCAAA 



3600 

45 TGTAAAATTG TACAAATAAT GAAATTAAAG ATTTAGTCTC TTTTATTTTT TTTGTTTAGG 

3660 

GTGTATATAT ATATATATAT GTATATTTGT TGCATTGATA TATCAATGAG AGGGAGAGAA 

50 3720 
CTCAGAGAAG TGTCGGAAAT TAAAATGGTA CGAGCCAATT GGAATCTCTG GCATTCTGAG 



3780 

CTTCATTTGT TTGTTATTAG AAAAAAAAAA AAAAAATCCT TTAAAGATAC CTTCATGATG 

3840 

ACATTGAATC ATGTAATATA CACGATACAT GGTCTAATTC CTCCTCAAAC CCTAATTACC 



3900 

60 AATTTCGAAA CCATAATATT TACTAGTATG TTTATATATC CTTACTTTAA GACATTGTTT 

3960 

GTTTATAATA CCTTGTGAAT TAAGAAAAAA AAAAAAAAAC TTGTGGATCT ATTCAAGCCA 

65 4020 
TGTGTTAGAA TAAATTTATA AATTTTCTCC TCGTACTGGT CAGATATTGG TCCAAACTCC 

4080 



51 




AAAGCCTTCC CTTTTCAGGA AAAAAAACAT TTCGAAATTA ACTCTAATTA ATCAAGAATT 

4140 

TCCTACAATG TATACATCTA ATGTTTTTTC CGCGATCTTA CTTATTAGTG TGAGGGGTAC 

4200 

AATTGAAAGG TACAAGAAAG CTTGTTCCGA TGCCGTCAAC CCTCCTTCCG TCACCGAAGC 



10 



4260 

TAATACTCAG GTACCAATTT ATATTGTTTG ATTCTCTTTG TTTTATCTTC TTCTTTTCAT 



15 



4320 

TATATATATG ATCAACAAAA AATATAACCT ACAAAAAGAG AGAGTTCAAG GAAATGCATT 

4380 

GAAACGGTTT CGTTATGGTG TTTGAATACA TGGATTTTTG AAGTACTATC AGCAAGAAGC 



20 



4440 

CTCTAAGCTT CGGAGGCAGA TTCGAGATAT TCAGAATTCA AATAGGTAAT TCATTAACTT 

4500 

TTCATGAACT CTTCGATTTG GTATTAGGTC ACTTAATTTG GTGTCGGTCC AAAAGTCCGC 



25 



4560 

TTGTAGTTTT CTTTAGAAGT TGTTTTGTTT AATGTTCATG TTTACAAATT GAAGGCATAT 



30 



4620 

TGTTGGGGAA TCACTTGGTT CCTTGAACTT CAAGGAACTC AAAAACCTAG AAGGACGTCT 

4680 

TGAAAAAGGA ATCAGCCGTG TCCGCTCCAA AAAGGTAAAA TCTACGTTGC TCTCTCTCTG 



35 



4740 

TGTCTCTGTC TCTCTCTCTA TATATAGTCC CTTAGTTTAT ATAGTTCATC ACCCTTTTGT 

4800 

GAGAATTTTG CAGAATGAGC TGTTAGTGGC AGAGATAGAG TATATGCAGA AGAGGGTAAG 



40 



4860 

AACGTTTCTC CCATTCCAAG TAATTAGATC TTTCTTCGTC TTTGTGAGGG TTTGAGTTTT 



45 



4920 

CCCATAAATC ATGTGTAGGA AATGGAGTTG CAACACAATA ACATGTACCT GCGAGCAAAG 

4980 

GTTAGCCACG TTCTGTTCCA AATCTTAATC TCAATATCTA CTCTTTTCTT CATTGTATAA 



50 



5040 

CTAAGATAAC GTGAATAACA AGAAAACTTT TGTTTTTGGG TTTAATAGAT AGCCGAAGGC 

5100 

GCCAGATTGA ATCCGGACCA GCAGGAATCG AGTGTGATAC AAGGGACGAC AGTTTACGAA 



55 



5160 

TCCGGTGTAT CTTCTCATGA CCAGTCGCAG CATTATAATC GGAACTATAT TCCGGTGAAC 



60 



5220 

CTTCTTGAAC CGAATCAGCA ATTCTCCGGC CAAGACCAAC CTCCTCTTCA ACTTGTGTAA 

5280 

CTCAAAACAT GATAACTTGT TTCTTCCCCT CATAACGATT AAGAGAGAGA CGAGAGAGTT 



65 



5340 

CATTTTATAT TTATAACGCG ACTGTGTATT CATAGTTTAG GTTCTAATAA TGATAATAAC 

5400 

AAAACTGTTG TTTCTTTGCT TAATTAGATC AACATTTAAA TCCAAAGTTC TAAAACACGT 



52 



5460 

CGAGATCCAA AGTTTGTCAT ACAAGATTAG ACGCATACAC GATCAGTTAA TAGATTTTAA 

5520 

5 GTGCCTTTTA ATATTTACAT ATAGTTGCAG CTTCGATTAG ATCATGTCCA CCAAACACTC 

5580 

ACAATTAGAG ACAAGCAAAA CTATAAACAT TGATCATAAA ATGATTACAA CATGTCCATA 
10 AATTAATTAT GGATTACAAA AATAAAAACT TACAAAAGAT CT 



SEQ ID NO:6 SHP2 genomic 

so 

15 GAATTCGTAA CAGAATTTAG TGAATAATAT TGTAATTACC AGGCAAGGAC TCTCCAAACG 

120 

GATAGCTCGA ATATCGTTAT TAAAGAGTAA ATGATCCAAT ATGTAAGCCA TTGTTGATCA 

20 180 
TCTAACATTG TTGGACTCTC TATTGCTCGA AATGATGCAT ACCTAATCAT TTATTCAGTT 



25 



40 



55 



240 

AACTATCAAG TTGCATTTGT AAAAACCAAA CATTTAAATT CAGATTTGAT ATCACTTACA 

300 

GAGGATAGAG AAGCATGACT CCAGGCCTGC ATGCAACAAG AAAAAGGAAG AAAATAATGT 



360 

30 TAAAAATTTG ACAAATATAG TGTTTATTTT TATTATATGA GACAGAATTT GAATAAAATC 

420 

CTACCCAACT AGAGCATCAA AACGTTTTGC AATCGCAATA ATGAAACCCA TTTTCTTTTT 

35 480 
GAGTTTTTAC TCTTCTTTCA ACAGAAACTT TCTCAAACGT CTTTAGCACT GTGACGTTAG 

540 

ATATATACAC AAAAGCTTGA AATTTCTTCA AGCAAAAGAA TCTTTGTGGG AGTTAAGGCA 



600 

ACAAGCCAGG TAAAGAATCT CCAACGCATT GTTACGTTTT CATGAACCTA TTTATTATAT 



660 

45 GTTCTAAGAA AGAAAAAAAT ATCTCAAAGT AAACGTTGGA AATTTTCTGA TGAAGGGAAA 

720 

TCCAAAGTCT TGGGTTTAGT ATCCCTATGA ATGGTATTTG GAATATGTTT TCGTCAAAAC 

50 780 
AAAAGATTCT TTTCTTTTTC ACAAGAGTTA GTGATCAATA ACTTATGCAC TAATTAATGA 

840 

GATTGGACGT ATACACAATT TGATTATGAT ACTTGAGTAA AAATCACCTG TCCTTTAATT 



900 

TGGAAATCTC TCTTTCTTAC CCATTTATAT ACTACTTCTT TTCATTAAAA TTAAATTTCA 



960 

60 ATTATCAATC ATCGTTCAAT TTGATAAAGA TTTAACATTT TTTGTCACAG GGCTAGTAAA 

1020 

AGCAATCTTT ACATAATTCA TCTTTCTTAC ATATATATAT TACCTTTTTC TTCATTAGTA 

65 1080 

TTCTATTTGA TTATGATTAT TTTGTCATAA AGCTAGTAAA TTAAACACTC GATATGAGAA 



53 



% 



10 



25 



40 



55 



1140 

TTATATTACT TCACGCTAAT TAACTCTTAA CACAACAAGA ACTAGTGCAT ATTCAACTTT 

1200 

CAAAGCATAT ACTATATATT GAGAATATAG ACCACGAAAG TCAATCAAAA GACCTACCAG 

1260 

CTCTCATCAA GTTCTTTCTT GAAATGATTT TGCAGAATTT CCAACTTAAT TAATTCGACA 

1320 

TGAATGTGAA AATGTGTGTT GCTCGTTAAG AAAATTGAAT AGAAGTACAA TGAAAATGAT 



1380 

15 GAGGAATGGG CAAAACACAA AAGAGTTTCC TTTCGTAACT ACAATTAATT AATGCAAATC 

1440 

TGAGAAAGGG TTCATGGATA ATGACTACAC ACATGATTAG TCATTCCCCG TGGGCTCTCT 

20 1500 

GCTTTCATTT ACTTTATTAG TTTCATCTTC TCTAATTATA TTGTCGCATA TATGATGCAG 

1560 

TTCTTTTGTC TAAATTACGT AATATGATGT AATTAATTAT CAAAATAAAT ATTCAAATTG 



1620 

CCGTTGGACT AACCTAATGT CCAAGATTAA GACTTGAACA TAAGAATTTT GGAAAAACTA 



1680 

30 AACCAGTTAT AATATATACT CTTAAATTGC CATTTCTGAA CACAACCAAA TAATAATATA 

1740 

TACTATTTAC AGTTTTTTTT AATTGGCAAG AACACTGAAA TCTTATTCAT TGTCTCGCTT 

35 1800 
GGTAGTTGAC AAGTTATAAC ACTCATATTC ATATAACCCC ATTCTAACGT TGACGACGAA 



1860 

CACTCATATA AACCACCCAA ATTCTTAGCA TATTAGCTAA ATATTGGTTT AATTGGAAAT 

1920 

ATTTTTTTTA TATATAAAAT GCCAGGTAAA TATTAACGAC ATGCAATGTA TATAGGAGTA 



1980 

45 GGGCAATAAA AAGAAAAGGA GAATAAAAAG GGATTACCAA AAAAGGAAAG TTTCCAAAAG 

2040 

GTGATTCTGA TGAGAAACAG AGCCCATACC TCTCTTTTTT CCTCTAAACA TGAAAGAAAA 

50 2100 

ATTGGATGGT CCTCCTTCAA TGCTCTCTCC CCACCCAATC CAAACCCAAC TGTCTTCTTT 



2160 

CTTTCTTTTT TCTTCTTTCT AATTTGATAT TTTCTACCAC TTAATTCCAA TCAATTTCAA 

2220 

ATTTCAATCT AAATGTATGC ATATAGAATT TAATTAAAAG AATTAGGTGT GTGATATTTG 



2280 

60 AGAAAATGTT AGAAGTAATG GTCCATGTTC TTTCTTTCTT TTTCCTTCTA TAACACTTCA 

2340 

GTTTGAAAAA AAACTACCAA ACCTTCTGTT TTCTGCAAAT GGGTTTTTAA ATACTTCCAA 

65 2400 
AGAAATATTC CTCTAAAAGA AATTATAAAC CAAAACAGAA ACCAAAAACA AAAAATAAAG 

2460 



54 



TTGAAGCAGC AGTTAAGTGG TACTGAGATA 
AATTAACTCT CTCATAATTC ATCTTCCCAT 
ATCTTGCTAA GCCAGGTATG GTTATTGATG 
TTTCTCCAAT CAAATTCTTC AGTTAATCCT 
GAGTGCAAAA GGATTTGATC TATTTCTCTT 
ATGGAGGGTG GTGCGAGTAA TGAAGTAGCA 
ATAGAGATAA AGAGGATAGA GAACACTACG 
AATGGTTTAC TCAAGAAAGC TTATGAGCTC 
GTCATCTTCT CCACTCGAGG CCGTCTCTAC 
AGCTAGATCT TGATTTTGTT GAATTTTTTT 
GTTTTTCAAT CTTTATGGTC TCTTTATAGT 
CTCTTTAAAA ATCCCCAAAA TTAGGGTTTG 
TTTCTCTTAG TAAAAAAGCA GTGAGGGTCT 
CTTGTTCCAG TCACTTTTTC TCCACAAATC 
TATGTCAGTT TGTACAAGAC ACTTCGATCA 
AGATTGATCA TTAGGTTTCC ATCATAGTAA 
ATAATATATA TTATTTGGCT ATATAAAAAA 
TAGGGAGAGA CTAGTAGGTG TTTGTCTTCT 
TTGTTAAATC AAGAAAATGA ATCAGGGACA 
TCCGATCCAT CAATCAAGAA AAATAACGAA 
TCTCCACTTC AAGTTGGGGA CTTGTCATTT 
AGCTCATGTT CATTTCACCA TTTTGATTAT 
AAAATATTGT TTTTATTTGC TTGGCTAGTT 



ATAAGAATAG TATCTTTAGG CCAATGAACA 

2520 

CCTCACTTCT CTTTCTTTCT GATATAATTA 

2580 

ATTTACACTT TTTTTTAAAA GTTTCTTCCT 

2640 

TATAAACCAT TTCTTTAATC CAAGGTGTTT 

2700 

GTGTTTATAC TTCAGCTAGG GCTTATAGAA 

2760 

GAGAGCAGCA AGAAGATAGG GAGAGGGAAG 

2820 

AATCGTCAAG TCACTTTCTG CAAACGACGC 

2880 

TCTGTCTTGT GTGACGCTGA GGTTGCTCTT 

2940 

GAGTACGCCA ACAACAGGTA CACATCTTTT 

3000 

TCTAGAATAA AGTTTCGACT CTTCTGGTGG 

3060 

TTTTTTCCTT AGTTTCTCTG AAGCTCAAAT 

3120 

TTTAAAACTA GGGAACCCTA CTTTAACTTC 

3180 

TCTCTGATCA TTAATTAGCA TCCCCCATAC 

3240 

CTTATAACAG TATCTATATA TGTATCTATT 

3300 

ATTTGATGAC CCATCAAGTT TTATTTCTGC 

3360 

TGAAAAAGTA GGGTTCTTGA TAAAATTATA 

3420 

GCTATGTAGA TTCCTTAAAA ATTGATTCAC 

3480 

GACACTTCTC TAATCTTTTG GTGAATCCTT 

3540 

AAGCTTATTG TTGAGTCACT TAATTAATCA 

3600 

ACAGAAAATT TTGATTTTTG ATTGTTATTT 

3660 

CCGTTTTTCT ATACGTTTCC AGCTATTAAC 

3720 

TTGTCTGCTT TTTAAAGATA AATGTTTTCA 

3780 

AATACTATAA TTGAGGTTGA TGTATGACTA 



55 



3840 

TAATCTATAA GTCAAGTCTC ATATCATGGA TCTAAGTTAA AACTAGTAAA TTTGTAGTTT 

3900 

5 CAATGTGAAC TTTCACAACG ACTAAAGAAC TGATCTGAAG TTTATAATGG ACATGACTAA 

3960 

TTTGATTAAC AAAAGAGGAA TGCATTATGT ATGTAGAAAC ATGTGATATA TATATGTTTC 

10 4020 
TATTATCAAA AGTGTAGTTA ACTTTCTTAT TTCAAACACC CTCATGCTTT AGTAGTATCT 



15 



30 



45 



60 



4080 

TACTTTTGAC ATTTCTCAAC TTCAGCTTTC CATTATACAA CAGCACAATG TAAATTACTT 

4140 

GTATATGAAT ATGAAAGCAT AACGTTATGC AAAGATTTCT AGCTTTTCTT TTTCTGTTTT 



4200 

20 GCAAAAGATT TACAAATATC ATGTTCTTGG TAAAAACATA CTTGCCTCAG CCACATATGC 

4260 

ATGTAAATGT AATGTTCAAA TATTAATTCA GGAAAAACAA AGAAGAAGCA AAATTAGCTT 

25 4320 
CTAGAGTAGG GAATCTATTG ACTTGACCTG AAAATCACTT CTTTTTCTTA AAGCCTAGTA 

4380 

GTGAATTTTT TAATCTAATT AGGCCAAAAT ATATACTAGC CTAAAATATA ATTTGGATTT 



4440 

TGTGTCGTAC ATAAATTGGG ACCAATTCCA ATTAACTAAG AGCATATGCA ATTCAAATTC 



4500 

35 TTTTTATTTT CTTCTCCGAT TTGCTACTTC TTTCTTTTGT ATGTTTTCAA ATTAGGATTA 

4560 

CACTTTTTTG GGGAAGTACA CATTAGGGTC TTCTCGAACT TTGATTATAC ATATATATAT 

40 4620 
ATATATATAT ATATAACTTT GTGAGATGTC ACTGTTAATA GATAATAGGC AATAACAATA 

4680 

ATATCCAAAA AAGAAGGCGC AAACAAATCA TATACTATAT GGTACTGGTC CATTCACTAT 



4740 

TTTGTCGGTT GAATTTAAGG TTTGGCGTAC AAACTTTGTT TCAAACCTTT ATTATTCCGT 



4800 

50 CTTTCTGTGT GTTTTGTATA TCCAGAAGAT AAAAATATCA ATTTCTTTAA CGACTTCATA 

4860 

TATATATATA TATATATATA TATATATATT TTTCTCTTCT GGTTTTAGTG TTTGAATCCA 

55 4920 
ACAGTTATAG TTTCGTGTGT CTTTGTTTTA CTTGTGGTGG TTTAAGTTTG AGATTTTCAC 

4980 

CGATTGCATC TATTTACATA TATAGCTACC ACAAAAAAGA TTGCATTTTA AAATCTTTTC 



5040 

CTTTGTGTGA ATGTTGATGA AGTGTGAGAG GAACAATAGA AAGGTACAAG AAAGCTTGCT 



5100 

65 CCGACGCCGT TAACCCTCCG ACCATCACCG AAGCTAATAC TCAGGTTAGC TTTTAATTAA 

5160 

TACACCTAGC TAGCTAGTTC GTTAATTACT TAATTTCTTC TTCTTTTAGT TATCTGACCT 



56 



10 



25 



40 



5220 

TTTTTTCACC TCTTGTAACA ATGATGGGAT CGAAATTGAT GAAGTACTAT CAGCAAGAGG 

5280 

CGTCTAAACT CCGGAGACAG ATTCGGGACA TTCAGAATTT GAACAGACAC ATTCTTGGTG 

5340 

AATCTCTTGG TTCCTTGAAC TTTAAGGAAC TCAAGAACCT TGAAAGTAGG CTTGAGAAAG 

5400 

GAATCAGTCG TGTCCGATCC AAGAAGGTAC ATCACTAACT CTCCATCAAT CTCCTTATCA 



5460 

15 TTGAATATAT ATCCATCTGA TTCTTGCCCG TTATATTTGG TTTTTCTCTC CAGCACGAGA 

5520 

TGTTAGTTGC AGAGATTGAA TACATGCAAA AAAGGGTAAA AGTAAAACCT ATCTTCCTTC 

20 5580 
ACAATGAACT ACCCCTACTT TATTAGCAAC TTCTCTTTCT GATGATCATC TTTTTTATTT 

5640 

TCTGTTGTCG CTTGCATTGT AGGAAATCGA GCTGCAAAAC GATAACATGT ATCTCCGCTC 



5700 

CAAGGTTTTA TACATAACTC TTTTTGGCAT TTTTGATCAT CATTTTTTTC CGGTAGACAA 



5760 

30 TCTCTTGATG TGCAAATTCT AAATATCTCT GCAGATTACT GAAAGAACAG GTCTACAGCA 

5820 

ACAAGAATCG AGTGTGATAC ATCAAGGGAC AGTTTACGAG TCGGGTGTTA CTTCTTCTCA 

35 5880 
CCAGTCGGGG CAGTATAACC GGAATTATAT TGCGGTTAAC CTTCTTGAAC CGAATCAGAA 

5940 

TTCCTCCAAC CAAGACCAAC CACCTCTGCA ACTTGTTTGA TTCAGTCTAA CATAAGCTTC 



6000 

TTTCCTCAGC CTGAGATCGA TCTATAGTGT CACCTAAATG CGGCCGCGTC CCTCAACATC 



6060 

45 TAGTCGCAAG CTGAGGGGAA CCACTAGTGT CATACGAACC TCCAAGAGAC GGTTACACAA 

6120 

ACGGGTACAT TGTTGATGTC ATGTATGACA ATCGCCCAAG TAAGTATCCA GCTGTGTTCA 
50 GAACGTACGT CCGAATTC 



SF 1081218 vl 



57 



